期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于改进的RAKEL算法的心电图诊断分类
赵静, 韩京宇, 钱龙, 毛毅
《计算机应用》唯一官方网站    2022, 42 (6): 1892-1897.   DOI: 10.11772/j.issn.1001-9081.2021061068
摘要284)   HTML13)    PDF (1176KB)(89)    收藏

心电图(ECG)数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些标签组合所对应样本稀少的情况,从而影响预测性能。为了充分考虑标签间的相关性,提出一种基于贝叶斯网络的RAKEL算法BN-RAKEL。首先利用贝叶斯网络找到标签间的相关性,确定候选标签子集;然后对每个标签采用基于信息增益的特征选择算法确定其最优特征空间,并针对每个候选标签子集利用最优特征空间相似性来检测其相关程度,以确定最终的具有强相关性的标签子集;最后在标签子集的最优特征空间上训练LP分类器。在实际的ECG数据集上,与多标签K近邻(ML-KNN)、RAKEL、CC和基于FP-Growth的RAKEL算法FI-RAKEL进行对比,结果显示所提算法在召回率和F-score上最少提高了3.6个百分点和2.3个百分点。实验结果表明,BN-RAKEL算法有较好的预测性能,能有效提升ECG诊断的准确性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于模拟退火的在线Web文档内容数据质量评估
韩京宇 陈可佳
计算机应用    2014, 34 (8): 2311-2316.   DOI: 10.11772/j.issn.1001-9081.2014.08.2311
摘要320)      PDF (1008KB)(327)    收藏

针对基于训练模型或用户交互的Web数据质量评估方法不能在线响应,也不能获取内容事实内涵的问题,提出一种基于模拟退火(SA)的在线Web文档内容数据质量评估(QASA)方法。首先,通过在Web上搜集主题相关文档,构建目标文档的相关空间,进一步采用开放式信息抽取技术抽取文档内容的事实;然后,采用SA技术在线构建两个最重要的数据质量维度即准确性和完整性的参照;最后,通过比对目标文档和维度参照的事实来量化数据质量维度。实验结果表明,QASA方法可以及时返回近似最优解,并保持与离线算法等同或高于10%的精度。该方法不仅能满足实时响应的要求,而且具有高的评估精度,可应用于在线识别高质量的Web文档。

参考文献 | 相关文章 | 多维度评价
3. 图上基于局部敏感哈希的多关键字索引
韩京宇 杨健
计算机应用    2014, 34 (12): 3475-3480.  
摘要163)      PDF (828KB)(574)    收藏

针对目前基于倒排表的图关键字索引不能有效处理多个关键字查询,也不能对关键字拼写容错的问题,提出一种位图和局部敏感哈希(BLH)相结合的双层索引来支持图的多关键字查询:上层构建位图,依据关键字组合的n-gram映射到子图类簇,每个类簇存储相似的子图;下层在每个类簇上构建局部敏感哈希索引,根据关键字组合的n-gram定位到包含关键字组合的子图。该方法可显著减少图上关键字查询的I/O,查询时间缩减80%;并且,基于n-gram构建索引,可以避免索引对拼写错误敏感,在关键字容错的前提下返回用户期望的结果。实际数据集上的实验结果表明BLH索引的有效性,可以支持万维网、社会网络的高效查询。

参考文献 | 相关文章 | 多维度评价
4. 主动学习在通信网络推荐系统中的应用
陈可佳 韩京宇 郑正中 张海进
计算机应用    2012, 32 (11): 3038-3041.   DOI: 10.3724/SP.J.1087.2012.03038
摘要1371)      PDF (630KB)(439)    收藏
稀疏网络中大量潜在链接的存在对于链接预测问题是一个很大的挑战。在链接预测任务中引入主动学习,挖掘网络中大量未连接节点对中的潜在信息,从未标记样本中挑选出系统最不确定的样本交由用户判别。获得标记后的样本将给系统较高的信息增益。在通信网络数据集Nodobo中的实验结果表明,使用主动学习之后,该方法为通信用户预测潜在联系人的准确率得到显著的提高。
参考文献 | 相关文章 | 多维度评价
5.

基于改进的RAKEL算法的心电诊断分类

赵静 韩京宇 钱龙 毛毅
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.20211061068
录用日期: 2022-03-02